کاربرد رگرسیون مولفه های اصلی برای مجموعه داده های با مشاهدات دورافتاده و گم شده

thesis
abstract

در این تحقیق به بررسی داده های با بعد بالا، که شامل داده های دورافتاده و گمشده می باشند، پرداخته می شود. روش های مختلف رگرسیون مولفه های اصلی که می توانند در صورت وجود داده های دور افتاده و گم شد ه استوار باشند بررسی می شود. سپس رگرسیون مولفه های اصلی استوار به عنوان روش رگرسیونی که بخاطر بعد بالا در متغیرهای پاسخ و پیشگو از روش تعقیب تصویر و تحلیل مولفه های اصلی برا ی کا هش بعد استفاده می کند ، و در برابر داده های دور افتاده وگم شده استوار می باشند را شرح می دهیم. سپس با استفاده از روشهای شبیه سازی برازش مدلهای رگرسیونی به داده هایی که با داده های دور ا فتاده و گم شده آلوده شده ا ندرا مورد بحث قرار می دهیم. در پایان با مقایسه روش های مختلف رگرسیونی برازش شده به داده های شبیه سازی شده، روش استوارتر در مقابل داده های دور افتاده و گم شده معرفی می گردد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

شناسایی نقاط دورافتاده در داده های نرمال بر اساس مقادیر Z اصلاح شده مشاهدات

در این مقاله، به دلیل اهمیت و گستردگی استفاده از توزیع نرمال، نمونه های مبتنی بر این توزیع در نظر گرفته شده، با استفاده از مقادیر برش وابسته به حجم نمونه، نقاط دورافتاده آنها شناسایی می شوند. برای به دست آوردن مقادیر برش بهینه یک مسا له تصمیم مطرح و به روشی کمبیشینه (مینیماکس) حل می گردد. در حل این مسا له از روش شبیه سازی بهره گرفته شده است .

full text

تعیین نقاط دورافتاده ، مشاهدات با نفوذ و برآورد نیرومند برای مولفه های اصلی

تجزیه مولفه های اصلی یکی از روشهای چندمتغیره است که هدف آن یافتن ترکیباتی از ‏‎p‎‏ متغیر ‏‎xp,...,x2,x1‎‏ جهت ایجاد شاخصهای غیرهمبسته ‏‎zp,...,z2,z1‎‏ می باشد که این شاخصها به ترتیب بیشترین تغییرات را شامل می شوند.

15 صفحه اول

تحلیل استوار داده های فضایی در حضور داده های دورافتاده

معمولاً تابع تغییرنگار که ساختار همبستگی داده­های فضایی را تعیین می­کند و نقش پایه­ ای در تحلیل آن­ها دارد، نامعلوم است و لازم است براساس مشاهدات برآورد شود. وجود داده­ های دورافتاده در مشاهدات تاثیر نامناسبی در برآورد تغییرنگار و سایر بخش­های تحلیل داده­های فضایی همچون پیش­گویی فضایی و برآورد پارامترهای روند دارد. در این مقاله ابتدا با استفاده از برآوردگرهای مقیاس، چند برآوردگر استوار جدید با ن...

full text

مدل رگرسیون لجستیک چند حالته با مقادیر گم شده و کاربرد آن در بررسی بیماری گواتر

In large–scale sampling opeartions (e.g. nation-wide health surveys) we always face the problem of non-response item(s) and/or non-response unit(s). In fitting a model to the data we have two groups of variables, namely dependent and independent variables. Non-response may occur for any of these groups of variables. In this paper we assume Y as a categorical dependent variable with three levels...

full text

آزمون تعیین خطای مشخص سازی مدل خطی عام برای داده های گم شده

در این مقاله مدل خطی عام را در تحلیل داده‌هایی که در آنها متغیرهای کمکی و متغیر پاسخ گم شدگی دارند، در نظر می گیریم. برای تعیین نیکویی برازش مدل خطی عام در حضور داده‌های گم‌شده، آزمون جدیدی را بر اساس آزمون رمزی(1969) می سازیم. نشان می دهیم که تحت فرض صفر، آماره های آزمون در برخی از حالات از توزیع فیشر تبعیت می کند و در برخی از حالات به توزیع شبه‌فیشر میل می‌کند. علاوه بر این، عملکرد آمارههای آ...

full text

شناسایی نقاط دورافتاده در داده های نرمال بر اساس مقادیر z اصلاح شده مشاهدات

در این مقاله، به دلیل اهمیت و گستردگی استفاده از توزیع نرمال، نمونه های مبتنی بر این توزیع در نظر گرفته شده، با استفاده از مقادیر برش وابسته به حجم نمونه، نقاط دورافتاده آنها شناسایی می شوند. برای به دست آوردن مقادیر برش بهینه یک مسا له تصمیم مطرح و به روشی کمبیشینه (مینیماکس) حل می گردد. در حل این مسا له از روش شبیه سازی بهره گرفته شده است .

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023